from bs4 import BeautifulSoup


# 第一个参数是要解析的html文本，第二个参数是使用那种解析器，对于HTML来讲就是html.parser，这个是bs4自带的解析器
soup = BeautifulSoup("<html>A Html Text</html>", "html.parser")

# 格式化输出
soup.prettify()


""" 
解析器类型:

Python标准库
BeautifulSoup(html, "html.parser")
1、Python的内置标准库
2、执行速度适中
3、文档容错能力强

lxml HTML
BeautifulSoup(html, "lxml")
1、速度快
2、文档容错能力强

lxml XML
BeautifulSoup(html, ["lxml", "xml"])
BeautifulSoup(html, "xml")
1、速度快
2、唯一支持XML的解析器

html5lib
BeautifulSoup(html, "html5lib")
1、最好的容错性
2、以浏览器的方式解析文档
3、生成HTML5格式的文档
 """
